今天是第十八天我們可以寫一個yolo 配合 AI去辨識動物的情緒,以下是程式碼
import cv2
import torch
from torchvision import transforms
from PIL import Image
import torch.nn as nn
# Step 1: 使用 YOLOv5 進行動物偵測
def detect_animal(image_path, yolo_model):
# 使用 OpenCV 加載影像
image = cv2.imread(image_path)
results = yolo_model(image)
# 假設 YOLOv5 回傳了 bounding boxes 和 labels
# 這裡假設 label 是 'animal' 的物體被偵測到了
detected_animals = []
for detection in results.xyxy[0]:
label = int(detection[5])
if yolo_model.names[label] == 'animal':
xmin, ymin, xmax, ymax = map(int, detection[:4])
detected_animals.append(image[ymin:ymax, xmin:xmax])
return detected_animals
# Step 2: 辨識動物情緒 (假設有一個預訓練的情緒辨識模型)
class EmotionRecognitionModel(nn.Module):
def __init__(self):
super(EmotionRecognitionModel, self).__init__()
self.conv = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
self.pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
self.fc = nn.Linear(16 * 64 * 64, 3) # 假設輸出 3 種情緒 (快樂, 生氣, 恐懼)
def forward(self, x):
x = self.pool(torch.relu(self.conv(x)))
x = x.view(-1, 16 * 64 * 64)
x = self.fc(x)
return x
def recognize_emotion(animal_image, emotion_model):
# 預處理圖像以適應模型
preprocess = transforms.Compose([
transforms.Resize((128, 128)),
image = Image.fromarray(animal_image)
input_tensor = preprocess(image).unsqueeze(0) # 增加批次維度
# 使用模型預測情緒
with torch.no_grad():
output = emotion_model(input_tensor)
# 將預測結果轉換為情緒標籤
_, predicted = torch.max(output, 1)
emotion = ['Happy', 'Angry', 'Fearful'][predicted.item()]
return emotion
# 主程式
if __name__ == "__main__":
# 加載 YOLO 模型 (YOLOv5)
yolo_model = torch.hub.load('ultralytics/yolov5', 'yolov5s')
# 假設我們有一個已經訓練好的情緒辨識模型
emotion_model = EmotionRecognitionModel()
# 影像路徑
image_path = 'animal.jpg'
# 使用 YOLO 偵測動物
detected_animals = detect_animal(image_path, yolo_model)
# 辨識每隻動物的情緒
for idx, animal_image in enumerate(detected_animals):
emotion = recognize_emotion(animal_image, emotion_model)
print(f"動物 {idx + 1} 的情緒是: {emotion}")
區塊import cv2
import torch
from torchvision import transforms
from PIL import Image
import torch.nn as nn
函數)def detect_animal(image_path, yolo_model):
# 使用 OpenCV 加載影像
image = cv2.imread(image_path)
results = yolo_model(image)
# 假設 YOLOv5 回傳了 bounding boxes 和 labels
# 這裡假設 label 是 'animal' 的物體被偵測到了
detected_animals = []
for detection in results.xyxy[0]:
label = int(detection[5])
if yolo_model.names[label] == 'animal':
xmin, ymin, xmax, ymax = map(int, detection[:4])
detected_animals.append(image[ymin:ymax, xmin:xmax])
return detected_animals
:提取YOLO預測的物體標籤(如狗、貓等)。if yolo_model.names[label] == 'animal'
:檢查偵測到的物體是否為動物。xmin, ymin, xmax, ymax
:邊界框座標,定義了動物在圖像中的位置。detected_animals.append(image[ymin:ymax, xmin:xmax])
列表中。return detected_animals
類)class EmotionRecognitionModel(nn.Module):
def __init__(self):
super(EmotionRecognitionModel, self).__init__()
self.conv = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)
self.pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
self.fc = nn.Linear(16 * 64 * 64, 3) # 假設輸出 3 種情緒 (快樂, 生氣, 恐懼)
def forward(self, x):
x = self.pool(torch.relu(self.conv(x)))
x = x.view(-1, 16 * 64 * 64)
x = self.fc(x)
return x
函數)def recognize_emotion(animal_image, emotion_model):
# 預處理圖像以適應模型
preprocess = transforms.Compose([
transforms.Resize((128, 128)),
image = Image.fromarray(animal_image)
input_tensor = preprocess(image).unsqueeze(0) # 增加批次維度
# 使用模型預測情緒
with torch.no_grad():
output = emotion_model(input_tensor)
# 將預測結果轉換為情緒標籤
_, predicted = torch.max(output, 1)
emotion = ['Happy', 'Angry', 'Fearful'][predicted.item()]
return emotion
:將模型設置為評估模式,停用dropout等訓練特定的層。with torch.no_grad()
:停用自動梯度計算,節省記憶體並加速推理。output = emotion_model(input_tensor)
:將預處理後的圖像輸入到情緒辨識模型中,得到模型的輸出。torch.max(output, 1)
:將Tensor轉換為普通的Python數值。emotion = ['Happy', 'Angry', 'Fearful'][predicted.item()]
:將數值索引映射到對應的情緒標籤。if __name__ == "__main__":
# 加載 YOLO 模型 (YOLOv5)
yolo_model = torch.hub.load('ultralytics/yolov5', 'yolov5s')
# 假設我們有一個已經訓練好的情緒辨識模型
emotion_model = EmotionRecognitionModel()
# 影像路徑
image_path = 'animal.jpg'
# 使用 YOLO 偵測動物
detected_animals = detect_animal(image_path, yolo_model)
# 辨識每隻動物的情緒
for idx, animal_image in enumerate(detected_animals):
emotion = recognize_emotion(animal_image, emotion_model)
print(f"動物 {idx + 1} 的情緒是: {emotion}")
torch.hub.load('ultralytics/yolov5', 'yolov5s')
:從PyTorch Hub加載預訓練的YOLOv5模型,用於物體偵測。EmotionRecognitionModel()
:初始化情緒辨識模型。image_path = 'animal.jpg'
:設定影像檔案的路徑。detect_animal(image_path, yolo_model)
:使用YOLO模型偵測影像中的動物。for idx, animal_image in enumerate(detected_animals)
:遍歷所有偵測到的動物圖像區域,並使用情緒辨識模型進行情緒預測。print(f"動物 {idx + 1} 的情緒是: {emotion}")